Dostępność baz danych i zdygitalizowanych zbiorów rękopisów bezsprzecznie odmieniły warsztat badaczy i badaczek średniowiecza. Wpływ metod cyfrowych na analizę i interpretację źródeł historycznych jest jednak dużo głębszy, gdyż ich zastosowanie każe nam redefiniować podstawowe pojęcia, kwestionować założenia metodologiczne i poszukiwać modelu kształcenia, który uwzględniałby osiągnięcia współczesnej mediewistyki. Prezentując wyniki badań nad tekstami i strukturami władzy w średniowieczu, uczestnicy panelu podejmują refleksję nad szansami i ograniczeniami zastosowania metod cyfrowych zwłaszcza wobec postępów generatywnej AI. Wystąpienia będą punktem wyjścia do dyskusji o tym: Co jest przyczyną niedostatecznej recepcji badań cyfrowych w polskiej mediewistyce? Czy tworzenie i wykorzystanie narzędzi, baz czy korpusów może pogłębić jej interdyscyplinarność? Czy polskie uczelnie dostarczają młodym badaczom i badaczkom kompetencji, jakich wymaga badanie średniowiecza w XXI w.?
4. Texts, words, people of power: Digital methods in the analysis of historical texts
The availability of databases and digitised manuscript collections has undeniably transformed the work of medievalists. However, the influence of digital methods on the analysis of historical sources is much deeper, as their application forces us to redefine basic concepts, question methodological assumptions, and search for a training model that would take into account the achievements of contemporary medieval studies. While presenting research results on power in the Middle Ages, panellists reflect on the opportunities and limitations of applying digital methods, especially in light of advances in generative AI. The presentations will serve as a starting point for discussion: What is the cause of the insufficient reception of digital research in Polish medieval studies? Can creating and using tools, databases, or corpora deepen its interdisciplinarity? Do Polish universities provide young researchers with the competencies required for studying the Middle Ages in the 21st century?
Koordynatorzy
Katolicki Uniwersytet Lubelski Jana Pawła II
Instytut Historii im. Tadeusza Manteuffla PAN
Referaty
Modelowanie kościelnych struktur władzy. Czy(m) praca “edytora cyfrowego” różni się od “analogowego”?
dr hab. Anna Zajchowska-Bołtromiuk
Instytut Historii PAN
Celem referatu jest omówienie metodologicznych założeń oraz praktycznych rozwiązań stosowanych w cyfrowej edycji Monumenta Vaticana Res Gestas Polonicas Illustrantia i możliwości wykorzystania tych narzędzi w badaniach historycznych. Prezentacja pokaże, że cyfrowa zmiana w edytorstwie źródeł to nie tylko większa dostępność i przeszukiwalność, ale także doskonalsze przygotowanie tekstu do analizy historycznej. Edycja cyfrowa w znacznie większym stopniu spełnia wymagania współczesnego edytorstwa naukowego. Odbiorca nie otrzymuje bowiem jedynie naukowo opracowanego tekstu źródła, ale także zestaw narzędzi do jego analizy. Do edytora należy nie tylko zapewnienie naukowego poziomu samej edycji, ale i jakości opracowanych danych, które mogą stanowić podstawę analiz prowadzonych zarówno przez badaczy, jak i przy użyciu dużych modeli językowych (LLM). W przypadku tego projektu jednym z największych wyzwań było stworzenie modelu opracowania danych dla struktur władzy średniowiecznego Kościoła.
Teksty władzy. Czy powinniśmy zostawić czytanie i analizowanie dokumentów rękopiśmiennych maszynom?
mgr Zdzisław Koczarski
Instytut Języka Polskiego PAN
Celem referatu jest krótka prezentacja narzędzi ułatwiających przygotowanie edycji cyfrowej oraz analizę porównawczą i stylometryczną powstałego tekstu, które pozwalają na znaczące zmniejszenie czaso- i kosztochłonności prac już na wczesnych etapach prowadzonych badań.
Omówione zostaną: (1) oprogramowanie do automatycznego rozpoznawania tekstu pisanego (HTR - handwritten text recognition); (2) aplikacja do analizy porównawczej, która umożliwia odnajdywanie wspólnych sekwencji wyrazowych w edycji i istniejących korpusach tekstów; (3) aplikacja do analizy stylometrycznej, która ułatwia atrybucję autorstwa i pozwala na osadzenie badanego tekstu w szerszym kontekście. Na przykładzie wybranego dokumentu rękopiśmiennego pokażę, że praca z takimi narzędziami nie tylko ułatwia odczytywanie tekstu, ale również przynosi wiele informacji na temat widocznych w nim podobieństw do innych dokumentów, relacji z innymi tekstami, osoby pisarza itd.
Słowa władzy. Od konkordancji do zanurzeń słów
dr Krzysztof Nowak
Instytut Języka Polskiego PAN
Wystąpienie stanowi praktyczne wprowadzenie do automatycznej analizy słownictwa dotyczącego władzy w dużych korpusach łaciny średniowiecznej. W pierwszej części krótko prezentuję założenia (hipoteza dystrybucyjna, paradygmat kwantytatywny itp.) i najważniejsze metody komputerowych badań nad znaczeniem.
Druga część referatu ma charakter praktyczny: przedstawiam w niej dwa studia przypadku, które ilustrują potencjał metod korpusowych w badaniach nad średniowieczem. Pierwsze z nich wprowadza techniki pracy z korpusem: od wyszukiwania interesujących badacza terminów, przez analizę ich dystrybucji w tekstach, aż po opis potencjału znaczeniowego za pomocą analizy kolokacji. Drugie z kolei poświęcone jest analizie pola semantycznego Wᴌᴀᴅᴢᴀ: omawiam w nim najpierw najważniejsze modele znaczenia (zwł. word embeddings), by następnie przedstawić praktyczne ich zastosowanie w ekstrakcji słów związanych z władzą w korpusach łaciny średniowiecznej.
Ludzie władzy. Co może wiedzieć GPT o średniowiecznej elicie polskiego społeczeństwa?
dr Adam Zapała
Instytut Historii PAN
Celem wystąpienia jest ukazanie potencjału dużych modeli językowych w badaniach historycznych na przykładzie analizy późnośredniowiecznej elity władzy. Przedstawiona zostanie procedura integracji danych z historiografii i źródeł historycznych z wiedzą Modelu, a następnie zaprezentowana metoda analizy z jego wykorzystaniem. Omówione zostaną także uzyskane wyniki oraz ich znaczenie. Wystąpienie ma na celu zainicjowanie dyskusji na temat wpływu sztucznej inteligencji na badania historyczne oraz roli badacza w tym procesie.